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(54) Verfahren zur Umwandlung von sprachlich elngegebenen Informationen in 
maschinenlesbare Daten 

(57) Um bei einer Umwandlung von sprachlich ein- 
gegebenen Informationen eines Benutzers (B) in ein 
Steuer- und Informationssystem (2) einer technischen 
Anlage in maschinenlesbare Daten bei hoher, ergono- 
mischer Eingabegeschwindigkeit eine hohe Zuverlas- 
sigkert auch bei einem komplexen zugrundeliegenden 
Wortschatz (W) zu gewahrleisten, werden erfindungsge- 
maB durch einen Vergleich von aufgenommenen 
Sprachelementen (Sj) m'rt einem anhand von Daten Qber 
den Benutzer (B) vorausgewahlten Teilwortschatz (TW|) 
den Sprachelementen (SJ durch diese bestimmte 
maschinelle Datenelemente (DEj) zugeordnet. Durch die 
Auswahl eines Teirwortschatzes (TWj) aus einem 
Gesamtwortschatz (W) wird die Komplexitat des zugrun- 
deliegenden Wortschatz es (W) erst wahrend der 
Spracheingabe reduziert, so daB eine hohe Erken- 
nungsrate gewfihrleistet ist. 
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Beschreibung 

Die Erf indung betrifft ein Verfahren zur Umwandlung 
von in ein Steuer- und Informationssystem einer techni- 
schen Anlage sprachlich eingegebenen Informationen 
eines Benutzers in maschinenlesbare Daten, bei dem 
durch einen Vergleich von aufgenommenen Sprachele- 
menten mil einem vorausgewShrten Teilwortschatz den 
Sprachelementen durch diese bestimmte maschinelle 
Datenelemente zugeordnet werden. Sie betrifft weiter 
ein System zur Spracheingabe von Informationen fur 
eine technische Anlage. 

Fur den Betrieb einer technischen Anlage, insbe- 
sondere einer Kraftwerksanlage, ist eine schnelle und 
zuverlassige Eingabe von Informationen eines Benut- 
zers in ein Steuer- und Informationssystem der techni- 
schen Anlage erforderlich. Fur die Weiterverarbeitung in 
Steuer- oder Regelprozessen mussen die eingegebe- 
nen Informationen in maschinenverarbeitbare Daten, 
beispielsweise Codes oder Rechnerbefehle, umgewan- 
delt werden. Insbesondere in der Leittechnik einer Kraft- 
werksanlage erfolgt eine derartige Informationseingabe 
ublicherweise uber eine Tastatur oder mausunterstutzt 
uber einen Bildschirm eines Computers. Eine derartige 
Informationseingabe ist jedoch zeitaufwendig, insbeson- 
dere im Vergleich mit gesprochenen Informationen. 

Eine schnellere Eingabe von Informationen kann 
mittels Spracherkennersystemen erfolgen. Dabei wer- 
den sprachlich eingegebene Informationen eines Benut- 
zers in maschinenlesbare Daten umgesetzt, indem 
aufgenommene Sprachelemente mit einem Wortschatz 
verglichen und anhand dieses Vergleichs maschinell 
identif iziert werden, wobei den identrfizierten Sprachele- 
menten maschinelle Datenelemente zugeordnet wer- 
den. Ubliche Spracherkenner ordnen eine erkannte 
Lautfolge einer Liste von Namen von Bedienelementen 
zu und wahlen das wahrscheinlichste Listendokument 
aus. Bei herkommlichen Spracherkennersystemen 
nimmt jedoch die Erkennungsrate der Sprachelemente 
und somit die Zuverlassigkeit der Spracherkennung mit 
zunehmender GroBe des Wortschatzes stark ab. Bei 
komplexen Wortschatzen, wie sie insbesondere beim 
Betrieb einer technischen Anlage oder einer Kraftwerks- 
anlage anfallen; sind herkommliche Spracherkenner 
daher unzuverlassig und somit nicht einsetzbar. Urn die 
Erkennungsrate eines Spracherkenners zu erhohen, 
muB der zugrundeliegende Wortschatz, zum Beispiel im 
Hinblick auf die Anzahl der enthaltenen Vvorter, einge- 
schrankt werden. Dies schrankt jedoch die Flexibilitat 
eines derartigen Spracheingabesystems ein. 

Ein System und ein Verfahren zur Spracheingabe 
von Informationen, bei dem der zugrundeliegende Wort- 
schatz in eine Anzahl von Teilwortschatzen gegliedert 
ist. ist aus der DE-A-42 16 455 bekannt Die Auswahl 
des Teilwortschatzes erfolgt dabei mittels eines sprach- 
lich eingegebenen Identrf izierungscodes. Eine derartige 
Vorauswahl ist jedoch zeitaufwendig und, insbesondere 
in Notfallsituationen, nur eingeschrankt zuverlassig, da 



der kferrtifizierungscode mit hoher sprachlich er Genau- 
igkert einzugeben ist. 

Der Erfindung liegt daher die Aufgabe zugrunde, ein 
Verfahren der obengenannten Art zur Umwandlung von 

s sprachlich eingegebenen Informationen eines Benut- 
zers in ein Steuer- und Informationssystem einer techni- 
schen Anlage in maschinenlesbare Daten anzugeben, 
das bei einem komplexen zugrundeliegenden Wort- 
schatz bei hoher Eingabegeschwindigkeit eine hohe 

w Zuverlassigkeit gewahrleistet. Dies soil mit einem beson- 
ders geeigneten System zur Spracheingabe von Infor- 
mationen fur eine technische Anlage erreicht werden. 

Bezuglich des Verfahrens wird diese Aufgabe erfin- 
dungsgemaB gelost, indem die Vorauswahl des Teilwort- 

15 schatzes anhand der raumlichen Position des Benutzers 
und/oder anhand der Gestik des Benutzers und/oder 
anhand der Blickrichtung des Benutzers und/oder 
anhand der Sprechrichtung des Benutzers erfolgt. 

Die Erfindung geht dabei von der Uberlegung aus, 

20 daB bei einer Aufteilung eines fur eine technische Anlage 
relevanten Wortschatzes in Teilwortschatze einer der 
Teilwortschatze vorausgewahlt werden kann. Auf der 
Grundlage des ausgewahrten Teilwortschatzes konnen 
dann aufgenommene Sprachelemente mit Elementen 

25 des Teilwortschatzes. insbesondere mit WOrtern oder 
Wortbestandteilen, verglichen und somit identifiziert 
werden. Durch die Auswahl eines Teilwortschatzes wird 
die Komplexitat des zugrundeliegenden Wortschatzes 
erst wahrend der Spracheingabe reduziert. so daB auch 

30 bei einem komplexen zugrundeliegenden Wortschatz 
eine hohe Erkennungsrate gewahrleistet ist. Weiterhin 
ausgehend von der Uberlegung, daB bei einer raumlich 
ausgedehnten Leitwarte einer Kraftwerksanlage kon- 
zeptionell zusammenhangende Anzeigeinstrumente 

35 und Bedienelemente eines Teilsystems der technischen 
Anlage Crtlich zusammengruppiert angeordnet sind, 
kann bereits durch die raumliche Position des Benutzers 
das zu bedienende Teilsystem identifiziert und somit der 
diesem Teilsystem zugeordnete Teilwortschatz ausge- 

40 wahit werden, wobei sich der Benutzer zur Bedienung 
dieses Teilsystems in dessen Nahe aufhalt. 

Durch die Vorauswahl des Teilwortschatzes anhand 
der Gestik wird dem Benutzer beispielsweise ermdglicht, 
durch Deuten auf ein Teilsystem der technischen 

45 Anlage, beispielsweise durch eine Armbewegung, das 
zu bedienende Teilsystem zu identif izieren. 

Ausgehend von der Beobachtung, daB konzeptio- 
nell zusammenhangende Anzeigeinstrumente und 
Bedienelemente eines zu bedienenden Teilsystems der 

so technischen Anlage ublicherweise in einem gemeinsa- 
men Blickbereich des Benutzers angeordnet sind. kann 
zudem durch die Ermittlung der Blickrichtung des Benut- 
zers das zu bedienende Teilsystem frQhzeitig erkannt 
und auf dieser Grundlage eine zutreffende Auswahl des 

55 Teilwortschatzes erreicht werden. 

Bezuglich des Systems zur Spracheingabe von 
Informationen for eine technische Anlage, bei dem ein 
Sprachdetektor zur Aufnahme von Sprachelementen 
eines Benutzers und ein Spracherkennermodul zur 
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Zuordnung von maschinenlesbaren Datenelementen zu 
Sprachelementen vorgesehen sind, wobei das Sprach- 
erkennermodul einen Analysebaustein zur Vorauswahl 
eines Teilwortschatzes aus einem im Spracherkenner- 
modul hinterlegten Wortschatz aufweist. wird die Auf- 5 
gabe erfindungsgemaB gelost durch ein 
Beobachtungsinstrument zur Beobachtung des Benut- 
zers. 

Von dem Sprachdetektor aufgenommene Sprach- 
elemente eines Benutzers werden an das Spracherken- 
nermodul weitergeleitet. Durch den Analysebaustein 
des Spracherkennermoduls erfolgt eine Vorauswahl 
eines Teilwortschatzes aus einem im Spracherkenner- 
modul hinterlegten Wortschatz anhand von von dem 
Beobachtungsinstrument ermittelten Daten uber dem 
Benutzers. Durch Vergleich der aufgenommenen 
Sprachelemente mit dem somit ausgewahlten Teilwort- 
schatz werden den Sprachelementen maschinelle 
Datenelemente zugeordnet, wobei eine hohe Zuverlas- 
sigkeit der Spracherkennung durch Reduktion des 
Gesamtwortschatzes auf den Teilwortschatz gewahrlei- 
stetist. 

Zur Auswahl von fOr die technische Anlage relevan- 
ten Schlusselsprachelementen aus alien aufgenomme- 
nen Sprachelementen weist das Spracherkennermodul 
zweckmaBigerweise einen Filterbaustein auf. 

In vorteilhafter Ausgestaltung ist das Beobach- 
tungsinstrument ein Positionsmelder zur Ermittlung der 
raumlichen Position des Benutzers. Anhand der mittels 
des Positionsmelders ermittelten Position des Benutzers 
kann ein zu bedienendes Teilsystem der technischen 
Anlage identrfiziert und ein diesem Teilsystem zugeord- 
neter Teilwortschatz ausgewahlt werden. 

GemaB einer zweckmaBigen Weiterbildung ist das 
Beobachtungsinstrument zur Ermittlung der Blickrich- 
tung oder der Gestik des Benutzers vorgesehen. Anhand 
der dadurch ermittelbaren Blickrichtung oder Gestik des 
Benutzers kann ebenfalls die Identifikation eines zu 
bedienenden Teilsystems der technischen Anlage und 
somit die Auswahl des diesem zugrundeliegenden Teil- 
wortschatzes erfolgen. 

Zur Ermittlung der Sprechrichtung des Benutzers 
weist das Spracheingabesystem einen Detektor auf. 

Die mit der Erfindung erzielten Vorteile bestehen. 
insbesondere darin, da 13 durch die Auswahl eines Teil- 
wortschatzes aus einem Gesamtwortschatz bei einem 
Spracheingabesystem die Zuverlassigkeit der Zuord- 
nung von maschinellen Datenelementen zu aufgenom- 
menen Sprachelementen auch bei einem 
zugrundeliegenden komplexen Gesamtwortschatz 
gewahrleistet ist. Durch die Auswahl des Teilwortschat- 
zes anhand von von der Spracheingabe unabhangigen 
Daten uber den Benutzer sind ein derartiges Verfahren 
und ein derartiges System besonders effektiv und 
besonders zuverlassig. 

Ein Ausfuhrungsbeispiel der Erfindung wird anhand 
einer Zeichnung naher erlautert. Diese zeigt ein System 

1 zur Spracheingabe von Informationen in eine Leitwarte 

2 einer nicht naher dargestellten Kraftwerksanlage. An 



der Leitwarte 2 sind Monitore 3 zur Darstellung von Infor- 
mationen und prozeBrelevanten Daten der Kraftwerks- 
anlage angeordnet. Die Kraftwerksanlage ist 
organisatorisch in Teilsysteme gegliedert, denen jeweils 
einer der Monitore 3 zur Darstellung der sie betreffenden 
Informationen zugeordnet ist. 

Das Spracheingabesystem 1 umfaBt einen Sprach- 
detektor 4 - beispielsweise ein Mikrophon - und ein 
Spracherkennermodul 6. Das Spracherkennermodul 6 
umfaBt einen Filterbaustein 8, eine uber eine Datenlei- 
tung 9 mit der Leitwarte 2 verbundene Zuordnungsein- 
heit 10. einen Analysebaustein 12 und eine Datenbank 
14. In der Datenbank 14 ist ein in mehrere Teilwort- 
schatze TW it mit i = 1, .... n, gegliederter Gesamtwort- 
schatz W hinterlegt. 

Ein Beobachtungsinstrument 16 ist uber eine Lei- 
tung 18 mit dem. Analysebaustein 12 verbunden. Das 
Beobachtungsinstrument 16 umfaBt einen Detektor 20 
und eine Kontrolleinheit 22. Der Detektor 20 ist zweck- 
maBigerweise eine Kamera. Er kann alternativ aber 
auch ein Mikrophonarray, ein Headtracker oder ein Eye- 
tracker sein. Anstelle der Lertungen 9, 18 kOnnen auch 
Funkverbindungen oder andere Datenubertragungsmit- 
tel vorgesehen sein. 

Mittels der Kamera 20 wird die durch den Pfeil BR 
angedeutete Blickrichtung eines Benutzers B des 
Spracheingabesystems 1 durch das Kontrollsystem 22 
des Beobachtungsinstruments 16 erfaBt und in einen die 
Blickrichtung beschreibenden Datensatz D umgewan- 
delt. Der Datensatz D wird uber die Leitung 1 8 an den 
Analysebaustein 12 ubergeben. Anhand des Datensat- 
zes D wird im Analysebaustein 12 der vom Benutzer B 
angeblickte Monitor 3' ermittelt und somit das zu bedie- 
nende und diesem Monitor 3' zugeordnete Teilsystem 
der Kraftwerksanlage identifiziert. Ein diesem Teilsy- 
stem zugrundeliegender Teilwortschatz TWj wird vom 
Analysemodul 12 aus den Teifwortschatzen TWj des in 
der Datenbank 14 hinterlegten Gesamtwortschatzes W 
ausgewahlt. Der ausgewahlte Teilwortschatz TWj wird 
vom Analysemodul 1 2 der Vergleichseinheit 1 0 berertge- 
stellt. Mittels des Sprachdetektors 4 aufgenommene 
Sprachelemente S } des Benutzers B werden dem Filter- 
baustein 8 zugefuhrt. Im Filterbaustein 8 werden aus den 
aufgenommenen Sprachelementen Si alle relevanten 
Schlusselsprachelemente ausgewahlt. Die Schlussel- 
sprachelemente SEj werden der Vergleichseinheit 10 
zugefuhrt. Anhand des ausgewahlten Teilwortschatzes 
TW t werden den ausgewahlten Schlusselsprachele- 
menten SEj maschinell verarbeitbare Datenelemente 
DEj zugeordnet. Die Datenelemente DEj, insbesondere 
Befehlscodes, werden. uber die Datenleitung 9 der Leit- 
warte 2 zugefuhrt und dort zur Steuerung oder Irrforma- 
tionsverarbeitung der Kraftwerksanlage herangezogen. 



1. Verfahren zur Umwandlung von in ein Steuer- und 
Informationssystem (2) einer technischen Anlage 
sprachlich eingegebenen Informationen eines 
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Benutzers (B) in maschinenlesbare Daten, wobei 
durch einen Vergleich von aufgenommenen Sprach- 
elementen (SJ mit einem vorausgewahKen Teilwort- 
schatz (TWj) den Sprachelementen (Sj) durch diese 
bestimmte maschinelle Datenelemerrte (DEj) zuge- 5 
ordnet werden, 

dadurch gekennzeichnet, daB eine Vorauswahl 
des Teilwortschatzes (TWj) aus einem hinterlegten 
Gesamtwortschatz (W) anhand der raumlichen 
Position des Benutzers (B) und/oder anhand der w 
Gestik des Benutzers (B) und/oder anhand der 
Blickrichtung (BR) des Benutzers (B) und/oder 
anhand der Sprechrichtung des Benutzers (B) 
erfolgt 

75 

2. System (1) zur Spracheingabe von Informationen 
fur eine technische Anlage, insbesondere zur 
Durchf uhrung des Verfahrens nach Anspruch 1 . mit 
einem Sprachdetektor (4) zur Aufnahme von 
Sprachelementen (Sj) eines Benutzers (B) urd mit 20 
einem Spracherkennermodul (6) zurZuordnung von 
maschinenlesbaren Datenelementen (DEj) zu 
Sprachelementen (Sj), wobei das Spracherkenner- 
modul (6) einen Analysebaustein (12) zur Voraus- 
wahl eines Teilwortschatzes (TWj) aus einem im 25 
Spracherkennermodul (6) hinterlegten Gesamt- 
wortschatz (W) aufweist, 

gekennzeichnet durch ein Beobachtungsinstru- 
ment (16) zur Beobachtung des Benutzers. 

30 

3. Spracheingabesystem nach Anspruch 2, 
dadurch gekennzeichnet, daB das Beobachtungs- 
instrument ein Positionsmelder zur Ermittlung der 
raumlichen Position des Benutzers (B) ist 

35 

4. Spracheingabesystem nach einem der Anspruche 
2 Oder 3. 

dadurch gekennzeichnet, daB das Beobachtungs- 
instrument (16) zur Ermittlung der Blickrichtung 
(BR) oder der Gestik des Benutzers (B) vorgesehen 40 
ist. 

5. Spracheingabesystem nach einem der Anspruche 
2 bis 4, 

gekennzeichnet durch einen Detektor zur Ermitt- 45 
lung der Sprechrichtung des Benutzers (B). 
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(54) Verfahren zur Umwandlung von sprachlich eingegebenen Informationen in 
maschinenlesbare Daten 

(57) Um bei einer Umwandlung von sprachlich ein- 
gegebenen Informationen eines Benutzers (B) in ein 
Steuer- und Informationssystem (2) einer technischen 
Anlage in maschinenlesbare Daten bei hoher, ergono- 
mischer Eingabegeschwindigkeit eine hone Zuverlas- 
sigkeit auch bei einem komplexen zugrundeliegenden 
Wortschatz (W) zu gewahrleisten, werden erfindungs- 
gemafi durch einen Vergleich von aufgenommenen 
Sprachelementen (S) mit einem anhand von Daten 
uber den Benutzer (B) vorausgewahlten Teirwortschatz 
(TW,) den Sprachelementen (Sj) durch diese bestimmte 
maschinelle Datenelemente (DEj) zugeordnet. Durch 
die Auswahl eines Teilwortschatzes (TWO aus einem 
Gesamtwortschatz (W) wird die Komplexitat des 
zugrundeliegenden Wortschatzes (W) erst wahrend der 
Spracheingabe reduziert, so daB eine hohe Erken- 
nungsrate gewahrleistet ist. 
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